模拟经营游戏《Project Hospital》的优化经验
本文将由《Project Hospital》的开发者Jan Benes分享该项目的优化经验。
由独立工作室Oxymoron Games使用Unity打造的《Project Hospital》(中文名:《医院计划》)是一款模拟经营类游戏。它具备该类型游戏的特点,包括:由玩家创建的动态场景,大量的活动角色和物体以及可扩展的UI系统。
让《Project Hospital》在不同硬件上运行需要不少努力,而且这也是“积小流以成江海”的典型性能优化案例,正是我们处理了许多小步骤,解决了大量具体问题,花费很多时间进行性能分析,才有最后性能卓越的提升。
性能目标
在早期开发阶段中,我们为将要支持的大型场景设定了主要性能目标以及硬件要求。
我们的目标是至少在一个屏幕上同时显示100个活动的动态角色。《Project Hospital》共有300个活动角色,大小约为100 x 100的瓦片地图,最多有4个楼层。
我们希望游戏以合适的帧率运行在1080P的画面中,即使在集成显卡上也有这样的效果。由于CPU是此项目标的主要影响因素,所以这种效果并不难实现。随着医院的扩大,集成显卡在2560 x 1440的高分辨率下才开始比较吃力。
为了实现简单的模组支持,游戏中的大部分数据都是开放的。这意味着和打包文件相比会牺牲一些性能,但这不会造成太大影响,只会稍微延长加载时间。
图形
由于《Project Hospital》是一款典型的2D等距游戏,所有内容都是从后向前渲染。在Unity中,这种渲染方式通过设置图形对象上正确的Z值或摄像机距离来表现。
在可能的情况下,不相互交互的对象会组织到不同图层,例如:地板和物体及角色是相互独立的。
等距渲染场景中的所有几何体都是使用C#代码动态创建的,因此对于图形性能而言,几何体重构的频率是重要部分之一,另一个重要部分是Draw Call的数量。
Draw Call
无论对象的简单程度如何,一帧中绘制的独立对象数量都是主要的限制,特别是在低端的硬件上,而Unity本身也有额外的开销。最好的解决方案是将更多图形对象批处理到单个Draw Call中。
这样得到一些有趣的结果,例如:由于支持批处理的对象是和摄像机有相同距离的对象,因此其它图形会得到正确的渲染。
下面列举几个数字:在96 x 96的贴图上,我们理论上可以放9216个对象,也就是要进行9216次Draw Call,在批处理后,Draw Call减少为192次。
在实际环境下,情况会变得更加复杂,因为只有具有相同的纹理的对象才可以进行批处理,所以得到结果的优化程度不那么高,然而这种方法依旧是很有效的。
大多数批处理通过手工完成,从而对结果进行控制。我们也使用了Unity的动态批处理作为后备方案,但这种方案是一把双刃剑。
Unity的动态批处理确实可以帮助减少Draw Call的数量,但是每帧都有额外性能开销,在某些情况下,性能开销会难以预测。
例如:与摄像机距离相同的二个重叠精灵会在不同帧以不同顺序进行渲染,这会造成精灵闪烁现象,手工进行的批处理则不会出现这种现象。
多楼层建筑
允许玩家构建多楼层建筑会增加很多复杂度,但是对性能有所帮助。
只有在活动楼层和户外环境的角色和物体需要动画和渲染,医院中活动楼层之下或之上的内容都可以隐藏起来。
着色器
《Project Hospital》使用相对简单的自定义着色器,利用了颜色替换等多个技巧。
例如:通过在着色器代码中使用条件,角色着色器可以使用最多5种颜色替代。它的性能开销较大,但因为角色很少占据屏幕的大量空间,所以这不是我们需要担心的问题。
我们也学会了如何避免设置着色器参数,转而使用顶点颜色。
纹理质量
有趣的是,我们没有在《Project Hospital》中使用任何纹理压缩。因为如果对游戏中存在矢量风格的图形进行压缩,有一些纹理会看起来非常糟糕。
为了节省系统上的GPU内存,使它小于1GB,除了用户界面的纹理外,我们会自动减小游戏内纹理大小为一半的分辨率,我们可以将选项设置为“texture quality : low”(纹理质量:低)。UI纹理会保持原始分辨率。
多线程处理
虽然Unity脚本逻辑基本上是单线程的,但我们可以选择使用C#代码运行多线程。对于游戏逻辑而言,这可能不是一种合理的方法,但是有些非时间相关的任务可以受益于以Job System形式在各个单独的线程上运行。
在这款游戏中,我们把多线程用于二个功能:
寻路作业,特别是在大型地图上,由于糟糕的布局可能需要数百毫秒处理,因此它是从主线程移除的理想选择。并行作业的数量会考虑到机器上硬件线程的数量。
光照贴图也会在单独的线程上更新,但每次仅更新一个楼层,它不是一个重要的系统,房间中的自动灯光会以较慢的更新速度淡出。
动画
在开发阶段早期,我们就决定使用2D骨架动画系统。在考虑当时不同的动画软件后,我们最后修改和使用了几年前开发的简单系统,使它符合《Project Hospital》的特别用例,你可以把它看作直接支持创建角色变体的简单样条曲线。
类似于样条曲线,该工具系统使用C#运行时,显然这比原生代码的性能开销更大,因此我们在开发期间进行了多轮优化。幸运的是绑定非常简单,每个角色仅有20个骨骼。
最重要的部分是在访问单独骨骼的Transform时,从地图查询切换为简单数组索引的过程。
除了不使摄像机视图外的角色有动态效果,另一个和动画相关的技巧是让主UI窗口背后的角色也不需要有动态效果,然而切换为半透明UI后,我们无法在最终版本使用这个技巧。
缓存
在可能的情况下,我们会尝试仅在有影响数值的改动时,运行有特别要求的计算。
最好例子大概是房间和电梯,在角色放置电梯或建起墙面时,我们会运行楼层填充算法,它会标记可以访问电梯和房间的瓦片。这样会加快寻路过程,向玩家展示哪些房间目前无法访问。
分散和延迟的更新
在一些情况下,我们会偶尔运行一次特定更新,我们使用了下面的方法。
一些更新每帧只可以在一部分角色运行,因此会出现这样的情况:一半病人的行为脚本仅在奇数帧更新,另一半会在偶数帧更新,而动画和移动会流畅的运行。
在特别状态下,有时角色闲置时会调用开销较大的代码,例如:员工检查过程需要填充和寻找可用设备,该过程仅在特定时期完成,例如:每秒进行一次。
性能开销最大且最常见的调用是每个病人可以进行哪些检查的估算。我们需要评估很多因素,例如:哪个部门的员工目前处于忙碌状态,哪些设备目前已被预订。
因为他们的指定医生和谈话技能也有影响,所以这些信息对所有病人来说并不常见。游戏中可能有多个可用检查需要执行,因此更新只在每帧进行几次,而且会持续到下一帧。
其它经验
优化具有大量不同交互部分的游戏是一个持续的过程,使用Unity的性能分析器能够解决性能影响较大的部分问题。游戏按照我们原来的目标运行,玩家可以给游戏添加模组,使游戏内容超过原始角色限制。
相对于我参与过的其他AAA级游戏项目,《Project Hospital》具有最复杂的游戏逻辑,因此很多问题是和项目相关的。
最后要建议大家:不管是什么项目,一定根据游戏的复杂性预留出足够的时间进行优化。
结语
《Project Hospital》的优化经验为大家介绍到这里,更多Unity项目的优化经验分享,尽在Unity Connect平台(Connect.unity.com)。
下载Unity Connect APP,请点击此处。 观看部分Unity官方视频,请关注B站帐户:Unity官方。
推荐阅读
《不可思议之梦蝶》从PC版移植到Nintendo Switch经验分享
Inside the Vault:3D环境艺术挑战赛获奖作品
Unity官方教师培训课程
7月29日-8月2日将举办Unity官方教师培训课程,现诚邀广大教师一同学习分享Unity最新技术,探讨Unity在教育教学中的创新应用。[了解详情......]
培训时间:7月29日-8月2日,共5天
报名地址:
https://www.bagevent.com/event/5329696
喜欢本文,请点“在看”